The article discusses the author's corps and its significance in modern glossary, the world of Pushkin's author's corps, the Czech writer's corps, Shakespeare's author's corps and their shortcomings. The interface of the author's corps is made up of different designs and structures, and the author is responsible for its completeness, the interface should be attractive and impressive. The creation of the interface is based on the design of the national or modern features, the interface should involve the life and works of the artist in photoes. The Corpus of Linguistics is a very rapidly developing branch of the world of computational linguistics, which has achieved great success in this regard.
The Corpus of Linguistics is also taught as a science in world universities. The subject of this discipline is the theory and practice of building a corpus, such as body features and the basics of programming. The Corpus of Linguistics deals with general theory and practice of computational linguistics, the formation of the language body, and computer technologies. The article tells about modern information technologies that have created tremendous opportunities for language functionality. Computer translation, editing, analysis, electronic dictionary and thesaurus are proof of our opinion. Especially the creation of modern electronic dictionaries and the culture of their use is one of the effective ways of learning a language. In particular, the role of language buildings created and developing at a fast pace throughout the world when demonstrating the ability and ability to master the language is very large. The purpose of the article is to study the linguistic foundations of the Uzbek language corpus, to study the linguistic value of the linguistic corpus, the history of corpus linguistics, to study the author's linguistics of the corpuses, its features in the social, lexicological, educational and other fields.
The article gives an idea about the interface, the content of the corpus, its flawless functioning and at first glance the importance of the author’s personality, creative heritage, classification.
В статье рассматриваются авторский корпус и его значение в современном глоссарии, мир пушкинского авторского корпуса, чешский писательский корпус, авторский корпус Шекспира и их недостатки. Интерфейс авторского корпуса состоит из различных конструкций и структур, и автор несет ответственность за его полноту, интерфейс должен быть привлекательным и впечатляющим. Создание интерфейса основано на дизайне национальных или современных функций, интерфейс должен включать жизнь и творчество художника в фотографиях. Корпус лингвистики — очень быстро развивающаяся отрасль мира компьютерной лингвистики, которая достигла больших успехов в этом отношении. Корпус лингвистики также преподается как наука в мировых университетах. Предметом этой дисциплины является теория и практика построения корпуса, такие как особенности тела и основы программирования. Корпус лингвистики занимается общей теорией и практикой компьютерной лингвистики, формированием языкового тела и компьютерными технологиями. В статье рассказывается о современных информационных технологиях, которые создали огромные возможности для языковой функциональности. Компьютерный перевод, редактирование, анализ, электронный словарь и тезаурус являются доказательством нашего мнения. Особенно создание современных электронных словарей и культуры их использования является одним из эффективных способов изучения языка. В частности, роль языковых зданий, созданных и развивающихся быстрыми темпами во всем мире при демонстрации способности и способности владеть языком, очень велика. Цель статьи — изучить лингвистические основы корпуса узбекского языка, изучить
лингвистическую ценность лингвистического корпуса, историю корпусного языкознания, изучить авторскую лингвистику корпусов, ее особенности в социальном, лексикологическом, образовательная и другие сферы.
Ҳозирги давримизда фанда, маданиятда, ижтимоий ҳаётнинг ҳамма соҳаларида, шу жумладан, тилда жаҳонийлашув жараёни шиддат билан давом этиб, миллий маданиятни ва қадриятларни аёвсиз ўз домига тортмоқда. Бундай хатарли жараёнлар шароитида ҳар бир миллат ўз тилининг келажагини ўйлаши ва унинг ижтимоий функциясини сақлаб қолиш учун ҳозирдан тайёргарлигини кўриши керак. Акс ҳолда, яқин келажакда тил ҳам, маданият ҳам, миллат ҳам ўз миллийлигини бой бериши мумкин. Тил жамиятдаги барча илмий ва фанний соҳаларнинг ривожланиш калити. Шунинг учун биз, биринчи навбатда, “Девони луғати-т-турк”дан бошлаб ҳозирги давргача бўлган туркий тилдаги асарлар тилининг матн корпусини яратишимиз ва ялпи луғатини (конкорданс) тузишимиз ва уларнинг мукаммал изоҳли қомусини яратишимиз керак. Иккинчидан, тилимизда мавжуд барча фан соҳаларидаги ажнабий терминларни рўйхатга олиш ва уларнинг ҳар бирини ғарб тиллари бўйича тасниф қилиш ва агар ўзбек тилида ёки бирон-бир туркий тилда муодили бўлса, уларни алмаш-тириш керак. Араб ва форс тилидан ўзлашган сўз ва иборалар тилимизга аллақачон ўрнашиб бўлган, бу ўзлашмалар ўзбек тили луғат бойлигининг ажралмас бир қисмидир. Шуниси борки, агар туркий ўзакли муодиллари бўлса, ўз захирасидан фойдалангани афзалроқ. Ўзбек тилида термин ясашнинг мукаммал мезонларини ишлаб чиқиш зарур. Ҳозирги пайтда термин ясаш бўйича аниқ ишлаб чиқилган йўриқнома йўқ. Бу соҳада дунё тажрибасини ўрганиб, аниқ бир дастур ишлаб чиқиш керак. Туркий тилдаги барча қомусларни жамлаш ва ундаги сўз бойлигидан ўзбек тилининг луғат бойлигини такомиллаштиришда фойдаланиш керак. Алишер Навоий ўзбек тилининг асосчиси ва энг йирик ижодий мерос муаллифи ҳисобланади. Шунинг учун, биринчи навбатда, унинг асарларидаги туркий сўзлик қатламини тўплаб, изоҳли луғатини яратиш керак.
Тарихдан маълумки, форс тили ўзининг тил хусусиятини йўқотмаган қадимий тиллардан бири ҳисобланади. Замонлар ва тарихий шароитлар бошқа тиллар лексикасига форсий сўзларнинг, қолаверса, араб тилининг таъсир ҳукмини ўтказган. Бу жараёндан ўзбек тили лексикаси ҳам мустасно эмас. Қадим замонлардан бери форстожик тилининг Мовароуннаҳр ўлкалари тиллари, хусусан, ўзбек тили билан ёнма-ён ишлатилиши кузатилади. Натижада, форс ва араб тилларидан кўплаб сўзлар ўзбек тили лексик таркибига сингиб кетган, яъни ҳам форс тилида, ҳам ўзбек тилида муштарак сўз сифатида ишлатилади. Аммо ишлатилаётган ҳамма муштарак сўзлар ҳам айни бир маънони ифодалаш учун қўлланилмайди. Ўзбек тилида шундай соф арабий сўзлар мавжуд эканки, уларнинг маъновий чегараси форс тилида бошқа мазмунни ифодаласа, ўзбек тилида умуман бошқа маънони ифодалайди. Эътиборли жиҳати, ҳар икки тилларда ишлатилаётган бу сўз-атама ҳар иккала тилда фаол нутқ қатламига оид. Қолаверса, солиштирилаётган тиллардаги айни сўзларнинг ясалиш усуллари халқаро стандартга мос бўлиши керак. Бундай тадқиқот натижасида форс ва ўзбек тилларидаги муштарак сўзларнинг этимологик асоси ва ясама сўзнинг чегаравий маъноси масалаларига ойдинлик киритилади. Масалан, ўзбек тилида бўлган ‘мухторият‘, ‘маъмуриятʼ, ‘маъмурʼ, ‘муқобилʼ, ‘ҳакамʼ, ‘ташрифʼ, ‘инсонпарварликʼ, ‘дорулфунунʼ, ‘хусусийлаштиришʼ, ‘иқтисодиётʼ, ‘жаридаʼ, ‘маълумотномаʼ, ‘режаʼ, ‘дастурʼ, ‘инқилобʼ сингари асли жуда кўплаб асоси арабий ўзлашмалар борки, уларнинг маънолари араб тилидаги мазмунини тўлиқ акс эттирмайди. Ҳатто мазкур сўзлар бугунги кунда русча-байналмилал сўз-атама ўрнига таклиф қилинган ва аллақачон тилга сингиб улгурган, шунингдек, терминлик хусусиятларини акс эттирувчи муштарак сўзлар ҳисобланади. Мана шундай сўзларни семантик ва функционал жиҳатдан тадқиқ қилиш ўзбек лексикологиясининг ривожи учун хизмат қилади. Сабаби, 1989 йилда ўзбек тилига “давлат тили” мақоми берилиши билан, унинг нуфузи ҳақида қайғуриш вазифаси қўйилди. Шунга биноан, мақолада бугунги кунда ўзбек тилида ишлатилаётган форсий муштарак сўз-атамаларнинг семантик-структур таҳлили ёритиш мақсад қилинди.
The article is scientifically substantiated by the need to create a national corpus of the Uzbek language. Suggestions are given on the structure of the corpus, the program interface, the algorithm of the program, the technology for obtaining the results. Based on the experience of world scientists, the requirements for the data encoding format for the national corpus of the Uzbek language are described. The article says that the interface of the national corpus and the author's corpus has a different design, structure, its improvement is the responsibility of the author of the corpus, and the interface should evoke the first impression of the corpus, an attractive appearance. The interface should take into account decorations that reflect the national color, as well as symbols reflecting the classics or modernity, the interface should reflect the life and work of the artist, the works created by him should open in separate windows, partly in photo galleries. The types of internal and external interface are also discussed. The article analyzes the linguistic module and algorithm and its types from independent components of linguistic programs. The need for an algorithm for phonological, morphological and spelling rules for the formation of the lexical and grammatical code is scientifically substantiated. The importance of language modules, such as phonology, morphology and spelling, in the formation of the linguistic base of the national corpus of the Uzbek language is emphasized.
Мақолада тилнинг интернет, компьютер технологиялари тилига айланиши математик лингвистика, унинг давоми бўлган компьютер лингвистикасининг шаклланганлиги ва ривожланиш даражаси билан боғлиқлиги, айниқса, сунъий интеллект учун табиий тилларни моделлаштириш муаммоси хусусида мушоҳада юритилган. Ўзбек тилининг халқаро мақомини оширишда ўзбек тили миллий корпуси катта аҳамиятга эга. Компьютер лингвистикаси фани доирасида амалга ошири лаётган ишлар ўзбек тилидаги мавжуд муаммоларни ҳал этишда муҳим роль ўйнайди. Мақолада миллий корпус яратишнинг за руратлари нимада эканлиги, таълим жараёнида сўзнинг нозик қиррасини ўрганиш, уни нутқида қўллаш кўникмасини ша кллантиришда нимага таяниш кераклиги, ўзбек тили миллий корпуснинг фан ва миллат учун нима аҳамияти борлиги, ўзбек тили миллий корпуснинг асосий фойдаланувчилари ким бўла олиши мумкинлиги хусусида асосли фикр мулоҳазалар билдирилди. Корпуснинг асосий фойдаланувчилари, албатта, турли йуналишларда иш олиб бораётган тилшунос тадқиқотчилардир. Маълум бир даврдаги тилга оид ишончли статистик маълумотлар адабиётшунослар, тарихчилар ва бошка гуманитар соҳалар вакилларини ўзига жалб этиб келгандир. Тилни ўқитишда ҳам миллий корпуснинг ахамияти каттадир. Миллий корпус яра-тишнинг технологик жараёни хусусида фикр-мулоҳазалар баён қилинди. Жумладан, миллий корпус технологик жараёни: тан ланган матнлар асосида лексема ва сўз шаклларининг такрорланиши луғатини яратиш; олинган такрорланиш луғатининг ҳар қандай бирлиги учун матнни кўриб чиқиш; графикли сўзни бўғинга ажратиш ва бўғинларнинг такрорланиш луғатини тузиш; сўз захираларини саралаш; бир вақтнинг ўзида чекланма-ган файлларни қайта ишлаш; ташқи белгиларга эга бўлган матнлар корпусларини яратиш кабилардан иборатлиги изоҳлаб бе рилган.
Тадқиқот объекта: оммавий ахборот воситалар тили.
Тадқиқот мақсади: оммавий ахборот воситалари тилининг нутқ маданиятини меъёрий, коммуникатив ва этик аспектларда тадқиқ килишдан иборат.
Тадқиқот методлари: диссертацияда куйидаги методлардан фойдаланилди: лингвистик тавсиф методи, семантик-стилистик метод, компонент тахлил методи, матн билан боғлиқ тахлил, киёсий метод, акустик анализ (радио ва телевидение) методи, ижтимоий сурок методларидан фойдаланилган.
Олинган натижалар ва уларнинг янгилиги: нутк маданиятининг меърий, коммуникатив ва этик аспектларида оммавий ахборот воситалари ( газета, телевидение ва радио) тили илк бор монографик тадқиқот объекта сифатида тадқиқ этилди; оммавий ахборот воситалари тили ва нутқ маданияти масалаларини тилшуносликда ўрганиш принциплари аниқланди; нутқ маданиятининг замонавий концепцияси ёритилди ва оммавий ахборот воситалари талида нутк маданияти намоён бўлишининг ўзига хос хусусиятлари кўрсатилди; замонавий ОАВ тилининг хусусиятлари тахлил этилди; оммавий ахборот воситалари тилининг миллийлиги очиб берилди; газета тилининг социопсихолингвистик ва функционал-коммуникатив хусусиятлари ўрганилди; газета тилининг экспрессивлиги ва ундаги нутқий-маданий баҳоси аниқланди; телевидение ва радио тилининг хусусиятлари ёритилди ва уларнинг экспрессивлиги, нутқий-маданий баҳоси аникланди; оммавий ахборот воситаларида нутк маданиятининг меъёрийлик аспектида тадқиқ қилинди; оммавий ахборот воситаларида нутк маданиятининг коммуникативлик аспекта ёритилди; оммавий ахборот воситаларида нутк маданиятининг этик аспекта тахлил этилди; оммавий ахборот воситалари талида нутк маданияти аспектларининг ўзаро боғликдик жиҳатлари очиб берилди.
Амалий ахамияти: тадқикот натижаларидан умумий ва ўзбек тилшунослиги, нутк маданияти, услубият ва матн тахлили, социолингвистика, психолингвистика, риторика ва журналистика йўналиши бўйича машғулотлар ўтказишда, диссертациялар, монографиялар, дарсликлар, ўқув қўлланмалар ёзишда фойдаланиш мумкин.
Татбиқ этиш даражаси: Диссертация иши натижалари ва материалларидан Ўзбекистон давлат жаҳон тиллари университетининг халқаро журналистика факультета, Ўзбекистон Милий университетининг ўзбек тилшунослиги (нутқ маданияти ва нотиқлик санъати йўналиши) кафедрасида “ОАВ тили, услуби”, “Матбуот тили, услуби”, “Электрон ОАВ тили, услуби”, “Оммавий онгни шакллантиришда ОАВ тилининг ўрни”, “Нутқ сифатлари”, “Нутқ маданияти асослари” фанлари ва курслари бўйича маъруза ва амалий машғулот дарсларини олиб боришда кенг фойдаланилмоқда.
Қўлланиш сохаси: умумий ва ўзбек тилшунослиги, социолингвистика, психолингвистика, услубият, нутк маданияти асослари, нотиқлик санъати.